词性标注:在一段文本中,为每个词(或符号)自动分配其语法类别标签(如名词、动词、形容词等)的过程,常用于自然语言处理(NLP)与语料库分析。也常写作 POS tagging。
/ˌpɑːrt əv ˈspiːtʃ ˌtæɡɪŋ/
Part-of-speech tagging helps a computer tell nouns from verbs.
词性标注帮助计算机区分名词和动词。
Accurate part-of-speech tagging can improve search, translation, and other language technologies by giving words clearer grammatical roles in context.
高质量的词性标注能通过为词语在上下文中提供更清晰的语法角色,从而提升搜索、翻译等语言技术的效果。
该短语由 part of speech(词类/词性) 与 tagging(打标签、标注) 组合而成。“tag”原指“标签”,在计算与信息处理语境中引申为“给数据加上标记/注释”。因此“part-of-speech tagging”直译就是“给词性打标签”。